产品速递 | 云和恩墨Bethune Pro2——数据库实时监控和智能巡检平台
如有任何需求
可致电:400-660-8755 010-59007017,
或Email至:marketing@enmotech.com
Bethune Pro2 智能运维平台 ( 以下简称:Bethune Pro2 ) 是云和恩墨 ( 北京 ) 信息技术有限公司(以下简称:云和恩墨)自主研发的智能运维平台。囊括了日常运维中巡检和监控的大部分工作:巡检系统中能够自主采集并自动分析数据,通过多维度展示的图表,大大减轻企业运维人员数据库巡检的工作量;监控系统中,提供基于系统的实时数据采集和展示,并提供及时的基于阈值的预警功能。
产品简介
Bethune Pro 2系统集合了云和恩墨技术专家及大量一线工程师在日常工作过程中的智慧总结;同时辅助科学的分析方法与策略,旨在从数据层面,挖掘客户系统中可能存在的各种隐患,并持续多维度跟踪系统的变化情况,对系统进行多维度建模,确保系统在稳定而规范的范围内提供可持续的高质量服务。
本运维平台适用于企业内的以下两种角色:
运维工程师
运维工程师负责企业IT系统的日常维护工作,包括每日的系统巡检,日常的系统健康信息监控。
通过使用 Bethune Pro2,工程师可以通过每日巡检建议,快捷的感知各个数据库中存在的隐患与风险点。同时,结合Bethune Pro2 系统中各维度汇总页面(包括:Dashboard,容量中心,性能中心,安全中心,系统中心等),大致了解各系统的健康程度,判断系统是否异常,对于需要进一步分析的系统,还可以生成更详细的全维度分析报告,给出更加细致的诊断分析及建议。
从 v2.0.0 版本开始,运维工程师还可以从系统中心,进入系统相关的监控大屏,实时查看当前系统的运行状态,以及相关的基于阈值的警告信息。现已支持MySQL。
IT 管理者
IT 管理者需要从宏观层面知晓企业各大 IT 系统的健康状况,并对各个系统的变更进行有效的监督管理。通过使用 Bethune Pro2,IT 管理者可以很快捷的了解到各个数据库的健康状态,健康度评分,系统变更情况以及容量和性能的变化趋势。同时,Bethune Pro2 中提供的容量预测,也可以为企业的采购决策提供一定的参考。
Bethune Pro2 产品架构图
从部署的服务器的角度,可以将 Bethune Pro2 分为三层架构:
资料库服务
安装企业版 Oracle 数据库,用于存储 Bethune Pro2 采集和分析数据。
应用服务
安装 Bethune Pro2 主体应用程序及相关服务程序,用于采集与分析任务的调度,并提供对外访问的接口与服务。
Agent 服务
部署在待巡检的数据库服务器中,负责本地采集任务的执行,并与 Bethune Pro2 应用服务进行数据交互。
其中,资料库服务与应用服务原则上可以部署在同一台服务器中,但从安全性角度来说,建议将资料库服务与应用服务分开部署,同时加强资料库服务器的网络安全策略。
核心优势
Bethune Pro2 源于 Bethune (云和恩墨自主研发的公有版智能巡检平台),同时在内容和组织形式上了做了全新的升级,后台数据采用全新的数据组织架构,基于任务时间线的数据采集和增量管理,同时对巡检工作涉及到的各项任务进行了增强和优化。
在 v2.0.0 版本中,添加了巡检功能,提供准实时级的系统关键指标分析,展示与预警。
Bethune Pro 的优势主要表现在以下两个方向上:
自动化
一次巡检的生命周期,包括:数据采集,数据打包传输,结果分析汇总,图形化展示,建议的产生。Bethune Pro2 能自发处理所有这些巡检周期中的各项任务,完全不需要人工参与。同时,会在一天工作的开始,将当天的巡检建议主动推送给用户(包括系统站内消息,邮件,短信等多渠道通知系统),极大的降低巡检任务的工作量。
在监控体系中,通过 JDBC 直连数据库,实时采集各个目标节点中的运行指标信息,基于用户自定义的阈值进行预警通知。
容量智能预测
智能化
在数据分析阶段,Bethune Pro2 积极采用智能化的机器学习算法与策略。通过多方面相关数据的关联分析,同时结合机器学习算法的思路,产生有实际意义的建设性建议。
Bethune Pro2 主要包含但不限于如下特色功能:
1 容量智能预测
Bethune Pro2 目前的预测功能主要用于表空间剩余预测
每日凌晨启动空间预测分析程序,针对最新采集的各个系统表空间的使用率,采用机器学习算法,根据表空间历史剩余空间变化情况,拟合未来一段时间内的剩余空间变化趋势,判断在不继续添加数据文件的情况下,当前剩余空间降低到零的时间,从而得到当前剩余空间预计可以支撑使用的天数。
同时,在容量中心页面的空间预测部分,也能同步追踪到各个表空间剩余可用空间的历史变化趋势。
2 异常增长自动分析
Bethune Pro2 目前的异常分析功能主要用于空间异常预测,包括:数据库增长,表空间增长,段空间增长,每小时的 Redo 日志量等。
每日凌晨启动空间增长分析程序,针对最新采集的各个系统空间使用数据,采用机器学习算法,结合历史一段时间内的空间使用增量趋势,计算昨日各个维度空间增长量的合理范围,进而判断昨日实际增长量是否合理,对于增长量不合理的对象类型(数据库,表空间,段,Redo 量等),给出具体的数据提示,并通过每日建议的方式提醒用户。
异常增长自动分析
3 系统变更跟踪
Bethune Pro2 支持预设的 16 种不同类型的系统变更的持续追踪。
在页面中,Bethune Pro2 创新性的使用了时间轴的方式,将每天的系统变更汇总,串联成一条时间轴线,通过滑动遍历时间轴,可以快速的看出每天的系统变更数量。
同时,在每天的变更数汇总标签中,还可以点击检查当天的详细各类变更列表,便于更细一步的追踪系统中的各项变更。
4 DBLink 互联图谱
Oracle 数据库中,通过 DB Link 可以直接查询其他数据库中的数据,这为多系统之间的数据交换与协作提供了极大的便利。但这种跨数据库的查询也带来了额外的问题,那就是为了保证查询数据的一致性而导致的 SCN 的跳跃式增长,这种 SCN 跳跃式增长若频繁发生,会导致 SCN 增长量超过 Oracle 每日累积增长的上限,导致系统宕机,并且无法正常启动。
Oracle 提供了修复补丁,用于修复这类 SCN 问题,但需要梳理企业环境中所有数据库的 DB Link 互联关系,传统的方式需要在各个数据库环境中分别梳理各自的 DB Link,并将其汇总起来,得到整个企业环境中的 DB Link 互联关系图谱。
5 IP与系统关系图谱
企业环境中,每套数据库系统,其可连接的客户端应当是有限且可控的,当出现异常连接的 IP 时,需要时刻保持警惕,防止未知 IP 源的数据窃取与攻击。
Bethune Pro2 中通过每小时的监听日志增量采集,同时在每日凌晨启动系统分析程序,获取并更新各个系统与 IP 的关系图谱,以及各个 IP 发起的数据库链接请求数。
在安全中心页面,通过搜索指定的 IP,可获得 IP 对应的系统列表,或者搜索系统名称,可获得系统对应的 IP 列表。
6 实时监控大屏
在实时监控大屏中,集中展示了系统中部分关键指标的实时监控数据,部分监控数据具有阈值告警功能,可以在配置页面中,对这些阈值进行定制调整,以满足不同系统的定制化监控需求。
监控大屏中各个图表都可以动态变化大小,以满足不同客户不同偏重点的展示需求。
目前监控大屏主要包括如下内容:
·风险雷达图
通过一定的评分模型,将系统风险点,在不同维度进行积分,得到各个维度的风险指数,分值越大,风险越大。
·系统拓扑图
通过图形的方式展示系统中各个组件的运行状态,其间的数据交互流向,以及网络流量和延迟信息。
当系统中有节点异常的时候,通过图标的状态变化,能非常直观的看出系统内各个节点的运行情况。
·CPU 使用率
展示系统中各个主机的 CPU 使用率的变化趋势。
RAC 环境中多个实例在同一图表中展示,便于对比系统中各个节点的实时负载变化情况。
·空间使用类
囊括了 top 表空间使用情况,归档空间使用情况,以及主机内存的使用情况。
·活动会话
展示系统中各个节点实例中,活动会话的变化情况。
·IO 效率
展示系统中关键的几个 IO 类等待事件的平均等待时间。
·最近告警
通过滚动的方式,循环展示系统中最近的一些警告信息。
对于已知晓或者处理过的告警,可以手动删除。
7 MySQL监控大屏
Bethune Pro 为 MySQL 数据库设计了全新的监控大屏。针对 MySQL 实例较多的情况,设计了自定义监控大屏展示功能。一个监控大屏可以指定展示一个或多个 MySQL 分组。同时,为 MYSQL 数据库设计了默认的监控模板,用户也可以调整每个监控项的配置规则,阈值等组成一个新的模板。
部署说明
Bethune Pro2 智能巡检平台的部署主要包括三大部分
Bethune Pro2 资料库
Bethune Pro2 应用服务器
目标系统 Agent 客户端
各个部分的部署要求如下表所示:
注意:以上列表中的资料库和应用服务器可以部署在同一台服务器,但相应的配置需要同步叠加提高。
网络连通要求:
应用服务器需要能在Oracle 监听端口上连接资料库和目标服务器(默认1521)
应用服务器与目标服务器上需要安装有 telnet 或者ssh 客户端
应用服务器与目标服务器需要在 Agent 固定端口上互通(默认8008)
应用服务器上需要开通 9090、9093、8500、8009端口
用户环境中需要能在8080端口上与应用服务器互通,用户登录 Bethune Pro 环境
如果您有任何业务需求,欢迎拨打服务电话:
010-59007017
400-660-8755
数据驱动,成就未来,云和恩墨,不负所托!
专业服务:云化(分布式)数据中心解决方案支撑软件:分布式存储软件数据架构Oracle DB2 MySQL NoSQL专项服务:混合架构 / 安全 / 容灾 / 优化 / 整合升级迁移运维服务:运维服务 | 云化运维人才培养:个人教育培训 | 在线教育支撑软件:自动化运维软件 | 数据库监控软件应用架构
专业服务:中间件 | 数据建模与模型优化 | SQL审核与优化
支撑软件:应用开发质量管控平台
业务架构
数据治理 | 电子商务用户行业分析 | 数据资产运营